배수 팽창된 컨볼루션과 특징합계를 이용한 객체 검출 백본 네트워크

바니 나탈리아 쿤트조노; 고승현; 방양; 조근식; Vani Natalia Kuntjono; Seunghyun Ko; Yang Fang; Geunsik Jo

연구문헌

국내 논문지

홈 > 연구문헌 > 국내 논문지 > 한국정보과학회 논문지 > 정보과학회논문지 (Journal of KIISE)

정보과학회논문지 (Journal of KIISE)

Current Result Document :

한글제목(Korean Title)	배수 팽창된 컨볼루션과 특징합계를 이용한 객체 검출 백본 네트워크
영문제목(English Title)	Backbone Network for Object Detection with Multiple Dilated Convolutions and Feature Summation
저자(Author)	바니 나탈리아 쿤트조노 고승현 방양 조근식 Vani Natalia Kuntjono Seunghyun Ko Yang Fang Geunsik Jo
원문수록처(Citation)	VOL 45 NO. 08 PP. 0786 ~ 0791 (2018. 08)
한글내용 (Korean Abstract)	컨볼루션 뉴럴 네트워크의 발전으로 인해 객체 탐지, 이미지 세분화 및 객체 분류 분야에서도 100개 이상의 컨볼루션 레이어를 사용하는 Deep CNN을 사용하는 추세로 이어지고 있다. 그러나 Deep CNN을 사용하기 위해 많은 그래픽 메모리가 필요하며 제한된 자원이나 실시간 객체 탐지를 원하는 사람들에게는 이런 Deep CNN이 적합하지 않다. 본 논문에서는 배수 팽창된 컨볼루션과 특징합계 기반의 객체 탐지를 위한 새로운 백본 네트워크를 제안한다. 특징합계는 그래디언트를 쉽게 전달하고 컨볼빙으로 인해 발생하는 공간 정보의 손실을 최소화한다. 그리고 팽창된 컨볼루션을 사용함으로써 변수를 추가하지 않고도 개별 뉴런의 수용 영역을 넓힐 수 있다. 또한, Deep하지 않은 뉴럴 네트워크를 백본으로 사용함으로써 제한된 자원으로 이미지넷 데이터 세트에서 사전 교육을 하지 않더라도 제안하는 네트워크를 사용할 수 있다. Pascal VOC 및 MS COCO 데이터를 사용한 실험 결과 제안된 네트워크는 각각 71%와 38.2%의 정확도를 보였다.
영문내용 (English Abstract)	The advancement of CNN leads to the trend of using very deep convolutional neural network which contains more than 100 layers not only for object detection, but also for image segmentation and object classification. However, deep CNN requires lots of resources, and so is not suitable for people who have limited resources or real time requirements. In this paper, we propose a new backbone network for object detection with multiple dilated convolutions and feature summation. Feature summation enables easier flow of gradients and minimizes loss of spatial information that is caused by convolving. By using multiple dilated convolution, we can widen the receptive field of individual neurons without adding more parameters. Furthermore, by using a shallow neural network as a backbone network, our network can be trained and used in an environment with limited resources and without pre-training it in ImageNet dataset. Experiments demonstrate we achieved 71% and 38.2% of accuracy on Pascal VOC and MS COCO dataset, respectively.
키워드(Keyword)	객체 검출 백본 네트워크 배수 팽창 된 컨볼루션 특징합계 object detection backbone network multiple dilated convolutions feature summation
파일첨부	PDF 다운로드